pandas怎样去掉、过滤数据集中的某些值或者某些行

您所在的位置:网站首页 pandas 过滤列 pandas怎样去掉、过滤数据集中的某些值或者某些行

pandas怎样去掉、过滤数据集中的某些值或者某些行

#pandas怎样去掉、过滤数据集中的某些值或者某些行| 来源: 网络整理| 查看: 265

pandas怎样去掉、过滤数据集中的某些值或者某些行 发布时间:2021-02-05 13:46:19 来源:亿速云 阅读:261 作者:小新 栏目:开发技术

小编给大家分享一下pandas怎样去掉、过滤数据集中的某些值或者某些行,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

pandas怎样去掉、过滤数据集中的某些值或者某些行

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

pandas怎样去掉、过滤数据集中的某些值或者某些行

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

pandas怎样去掉、过滤数据集中的某些值或者某些行

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

pandas怎样去掉、过滤数据集中的某些值或者某些行

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3